Home

Home

16.3 텍스트 프롬프트 기반 객체 탐지 (Open-Vocabulary Object Detection)

Home / 인공지능 (Artificial Intelligence, AI) / 제목: Embodied AI & Modern Control / Chapter 16. 시각-언어 모델과 개방형 어휘 인식 (VLMs & Open-Vocabulary Perception) / 16.3 텍스트 프롬프트 기반 객체 탐지 (Open-Vocabulary Object Detection)

16.3 텍스트 프롬프트 기반 객체 탐지 (Open-Vocabulary Object Detection)

16.3 텍스트 프롬프트 기반 객체 탐지 (Open-Vocabulary Object Detection)
16.3.1 ViLD(Vision-Language Distillation)와 OWL-ViT: 텍스트 쿼리로 Bounding Box 추출하기
16.3.2 Grounding DINO: 언어적 맥락을 반영한 고성능 객체 탐지
16.3.3 로봇 매니퓰레이션을 위한 픽(Pick) 대상 식별: “빨간색 머그잔 말고 파란색 텀블러 집어줘”

Generated by Rust Site Gen